https://www.kaggle.com/datasets/paramaggarwal/fashion-product-images-dataset
不斷增長的電子商務行業為我們提供了一個龐大的數據集,等待被抓取和研究。除了專業拍攝的高解析度產品圖像,我們還有多個描述產品的標籤屬性,這些屬性是在編目時手動輸入的。除此之外,我們還有描述性文本,評論產品的特性。
此資料提供了時尚商品圖片的路徑、還有其描述,有以下資訊:
id
image link
gender
master Category
sub Category
article Type
base Colour
season
year
提供者有提示幾個目標可以嘗試:
是否可能構建一個生成對抗網絡(GAN),以類別作為輸入並輸出圖像?
對圖像屬性進行自動編碼,以便建立一個視覺搜索引擎,將圖像轉換為一個小編碼,然後將其發送到伺服器進行視覺搜索?
視覺相似性搜索?根據一個圖像,建議其他相似的圖像。
我會先從建立圖片分類器開始,有多的時間可以嘗試看看生成圖片。網站提供csv檔案,因此我們要自己寫程式把圖片抓下來,也可以預測到有些圖片可能會失效了,因此資料前處裡必須清理掉無效的資料,明天開始進行此資料集